sysuse auto, clear
reg price mpg
est store m1
reg price c.mpg##c.wei //基本回归+交乘项
est store m2
esttab m1 m2
center mpg wei, prefix(C_)
reg price mpg wei c.C_mpg#c.C_wei //只对交乘项去心
est store m3
reg price c.C_mpg##c.C_wei //对主变量、调节变量和交乘项都做去心
est store m4
esttab m1 m2 m3 m4, mtitle(ols nocenter center_inter center_all)
*-Notes:
*-中心化仅是方便一次项系数的解释,不能克服共线性,也不能解决内生性;
*-只关注交乘项的系数,中心化与否均可;
*-虚拟变量无需中心化
X 的边际效果依赖于 Z:
主效应项系数的方向和显著性重要么?
不重要,b1的含义:当Z=0时, X的变动平均会带来y的变动
主效应项要不要?
交互项?分组回归?
help margin
*再参数化
sum x1
scalar x1_mean = r(mean)
gen x1cx2 = ( x1 - x1_mean ) * x2
R2 越高越好吗?
reg y $x, r
predict yhat //加不加xb?
gen resid = y - yhat
predict uhat, residual
bcuse gpa2, clear
regress colgpa sat hsperc hsize hsizesq
*预测:sat = 1200、hsperc = 30、hsize = 5时的预测值:
*数据集中没有符合条件的观测值,需添加一条新观测:
set obs `=_N+1'
replace sat = 1200 in `=_N' // `=_N' 表示最后一行
replace hsperc = 30 in `=_N'
replace hsize = 5 in `=_N'
replace hsizesq = 25 in `=_N' // hsize=5时平方为25
*生成预测值
predict yhat if _n == _N, xb
list yhat if _n == _N
*-Note: 利用回归模型预测时,解释变量的值最好不要离开样本范围太远
*6-4d Predicting y When the Dependent Variable Is log(y):
reg lny x1 x2 x3
predict lnyh
predict uh, res
gen eu = exp(uh)
egen sumeu = sum(eu)
dis sumeu/_N //smearing estimator偏误修正估计值
gen m=exp(lnyh)
dis a0h*m //y的预测值
*过原点的回归
reg y m, noc //斜率即为α0_check的估计值
corr y yf
*-Note: 因变量为lny时转换为y后的可决系数=y的预测值与y观测值相关系数的平方
*Baum_4.6.1 Computing interval predictions (self-reading)
use http://www.stata-press.com/data/imeus/hprice2a, clear
quietly regress lprice lnox if _n<=100
predict double xb if e(sample)
predict double stdpred if e(sample), stdp
scalar tval = invttail(e(df_r), 0.025)
generate double uplim = xb + tval * stdpred
generate double lowlim = xb - tval * stdpred
summarize lnox if e(sample), meanonly
local lnoxbar = r(mean)
label var xb "Pred"
label var uplim "95% prediction interval"
label var lowlim "95% prediction interval"
twoway (scatter lprice lnox if e(sample), ///
sort ms(Oh) xline(`lnoxbar')) ///
(connected xb lnox if e(sample), sort msize(small)) ///
(rline uplim lowlim lnox if e(sample), sort), ///
ytitle(Actual and predicted log price) legend(cols(3))
Stata:Bootstrap-自抽样-自举法
Stata:手动实现置换检验(permutation)和自抽样(bootstrap)
本章主要参考资料:
课件/open5_regress.zip · lianxh/Stata公开课-连享会 - Gitee.com
线性回归中相关系数与决定系数相等的证明 - 知乎
相关系数和R方的关系是什么? - 知乎
Stata数据处理:各种求和方式一览